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摘要 : 【 目的 ] 通过 对 社交 网 站 平台 用 户 行为 的 分 析 , 发 现 社会 化 小 众 群体 中 的 核心 用 户 , 为 社会 化 资源 推荐 服 
务 提供 参考 。[ 方法 ] 收集 豆瓣 读书 用 户 的 1 208 个 标签 ,对 排名 前 100 位 的 标签 建立 标签 共 现 矩阵 , 分 析 用 户 
的 K- 核 网 络 结构 ， 人 研究 用 户 的 民 - 核 塌 缩 序列 的 波动 情况 。[ 结果 ] 与 度数 中 心 度 、 最 小 KK- 核 深度 值 等 方法 相 比 ， 
基于 K- 核 塌 缩 序列 方法 发 现 了 新 的 社会 化 小 众 群 体 中 的 核心 用 户 。[ 局 限 ] 样本 数据 规模 较 小 且 局 限于 某 领 域 ， 
排序 问题 不 能 得 到 很 好 的 解决 , 需要 进一步 改进 KK- 核 分 析 方 法 。[ 结论 ] 本 研究 有 利于 社交 网 站 平台 的 管理 者 制 
定 或 改进 新 的 资源 推荐 策略 ， 从 而 促进 社交 网 站 平台 更 好 地 发 展 。 
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目前 ,互联 网 大 数据 问题 日 益 严 重 ， 互 联网 每 天 
产生 的 数据 可 以 刻 满 约 1.68 亿 张 DVD 光盘 , 这些 数 
据 蕴 含 着 用 户 的 信息 行为 ， 即 “标签 ”, 它 与 男 外 两 个 
要 素 : 用 户 和 资源 , 已 经 成 为 社会 化 推荐 研究 的 主要 
对 象 (了 如何 深 度 挖 气 通 过 标签 建立 的 用 户 关 系 网 
络 , 为 用 户 提 供 精 准 的 符合 其 兴趣 偏好 的 资源 是 信息 
学 界 和 管理 学 界 等 关注 的 研究 热点 之 一 上 也 是 未 来 
10 年 中 非常 重要 的 信息 服务 方向 及 研究 课题 六。 

在 社会 化 网 络 服务 中 , 与 大 众 化 的 信息 需求 相 比 ， 
用 户 对 资源 的 需求 偏好 分 布 呈 长 尾 特征 ,趋向 于 小 众 
化 号 ,用 户 更 需要 个 性 化 的 信息 。 而 传统 的 过 滤 式 的 社 
会 化 资源 推荐 主要 集中 于 大 众 的 流行 的 信息 ,很 难 发 
现 小 众 社区 中 用 户 的 需求 。 因 此 , 一 方面 ,用户 需要 获 
取 深 层次 的 个 性 化 信息 所; 另 一 方面 , 用户 作为 偏好 
社区 的 一 员 , 与 社区 中 其 他 用 户 具 有 相同 或 相似 的 需 
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求 ， 因此 用 户 与 资源 之 间 由 于 关联 关系 结构 而 形成 和 
表现 出 小 众 化 的 结构 特征 ， 即 小 众 社 区 门 ,在 多 维 语义 
关系 (如 浏览 、 评 论 、 转 发 等 ) 的 虚拟 社交 社区 , 社区 内 
每 个 用 户 都 有 可 能 成 为 领域 内 的 小 众 核心 用 户外 ,如 
何 利 用 社交 平台 资源 , 通过 社会 网 络 及 复杂 网 络 等 分 
析 方 法 分 层 识 别 出 小 众 核心 用 户 , 是 目前 该 领域 内 需 
要 解决 的 重要 问题 。 


2 相关 工作 


国内 外 与 核心 用 户 相 关 的 研究 主题 主要 有 “意见 
领袖 ”与 “小 众 专 家 ”， 如 Momtaz 等 中 利用 社会 网 络 分 
析 法 综合 考虑 中 心 点 、 结 构 洞 、 点 入 度 等 辨别 出 意见 
领袖 ; Zhang 等 外 设计 基于 时 间 序 列 的 社 群 抽取 及 意见 
领袖 挖掘 的 聚 类 算法 , 并 以 天 涯 社区 为 例 , 通过 实证 
证 明 该 算法 的 可 行 性 ; Gnambs 等 nM 对 意见 领袖 的 知识 
和 特点 建立 了 适度 模型 ; 王国 华 等 趾 和 顾 品 浩 等 中 从 
突 发 性 事件 中 对 意见 领袖 的 识别 和 挖掘 进行 分 析 ; 李 
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纲 等 \ 以 MetaFilter 为 样本 数据 来 源 ， 从 中 介 中 心性 
和 聚 类 系数 的 角度 细 化 小 众 专家 ,判别 不 同时 期 小 众 
专家 的 用 户 特征 及 扮演 的 角色 ; 陈 福 集 等 "从 意见 领 
袖 的 引导 作用 研究 其 在 与 情事 件 中 的 影响 机 制 。 
总 体 上 , 利用 社会 网 络 分 析 方法 进行 社会 化 资源 
推荐 时 , 重点 是 如 何 识别 关系 网 络 中 的 核心 用 户 , 许 
多 学 者 主要 从 传统 的 度 中 心性 、 介 数 中 心性 、 近 邻 中 
心性 等 角度 分 析 ， 部 分 学 者 从 及- 核 值 的 角度 分 析 ， 如 
He 等 六 利用 KK 值 越 大 ,其 传播 能 力 就 越 强 的 特点 ,， 研 
究 微 博 中 个 性 化 信息 推荐 ; Kitsak 等 中 认为 社区 中 传 
播 效 率 较 高 的 用 户 一 般 存在 于 K- 核 分 解 中 ; 周 洲 等 呈 
提出 重要 度 评价 矩阵 识别 网 络 中 的 最 重要 用 户 , 分析 
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了 天 - 核 值 很 小 的 用 户 的 传播 能 力 ; 任 卓 明 等 中 利用 邻 
居 用 户 的 K- 核 信息 分 析 K- 核 值 较 小 用 户 的 传播 能 力 。 
而 很 少 学 者 从 K- 核 塌 缩 序列 的 角度 分 析 核 心 用 户 。 本 
文 主要 利用 K- 核 塌 缩 序列 识别 用 户 关 系 网 络 的 总 体 
分 裂 性 , 发 现 核 心 用 户 及 其 所 在 的 小 众 社区 , 将 其 所 
掌握 的 资源 推荐 给 其 他 用 户 。 


3 研究 设计 


3.1 基本 思路 

在 社会 化 资源 推荐 过 程 中 , 按照 核心 用 户 的 发 现 
过 程 构建 如 图 1 所 示 的 社会 化 资源 推荐 模型 。 首 先 构 
建 用 户 关系 网 络 ， 并 对 其 进行 K- 核 分 解 , 构建 用 户 的 
K- 核 塌 缩 序列 ， 分 析 网 络 的 总 体 分 裂 性 ， 如 果 存 在 分 
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图 1 基于 区 - 核 塌 缩 序列 的 社会 化 资源 推荐 模型 
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裂 ， 则 能 够 发 现 其 中 的 核心 用 户 ; 然后 进行 高 密度 子 群 
筛选 ， 发 现 小 众 社区 ; 最 后 将 核心 用 户 所 掌握 的 信息 推 
荐 给 小 众 社区 的 其 他 用 户 , 完成 社会 化 资源 推荐 。 
3.2 ”构建 K- 核 网 络 结构 

K- 核 是 研究 复杂 网 络 的 层次 结构 非常 有 效 的 方 
法 ， 从 中 可 以 发 现 具有 凝聚 性 的 子 群 ， 它 是 以 度数 为 
基础 的 一 种 测量 标准 , Seidmant 认为 对 成 分 结构 的 研 
究 可 以 运用 最 小 度 标 准 ， 以 便 区 分 高 、 低 凝聚 力 的 领 
域 。 对 一 个 图 的 “区 - 核 ?结构 分 析 是 对 密度 测度 的 一 个 
重要 补充 , 一 个 K- 核 是 一 个 最 大 子 图 ,其 中 的 每 个 用 
户 都 至 少 与 其 他 K 个 用 户 连 接 : 每 个 用 户 的 度数 都 至 
少 为 K, 一 个 简单 的 成 分 就 是 一 个 “1- 核 ”， 其 中 所 有 用 
户 都 相连 ,因而 其 度数 至 少 为 1;“2- 核 "就 是 去 掉 所 有 
度数 为 1 的 用 户 , 考察 剩余 各 个 用 户 之 间 的 关联 结构 ， 
它 是 由 度数 为 2 的 剩余 关联 用 户 组 成 的 ， 其 他 的 以 此 
类 推 。 

对 于 一 个 无 向 图 G=(V E), V 为 用 户 , E 为 用 户 之 
间 的 标签 共 现 集 , 在 集合 WEYV 中 最 大 的 子 图 He=(W， 
E | W) 就 是 K- 核 , 即 对 于 任意 的 Ve C, 度 Pew 二 K, 
此 时 网 络 中 存在 K- 核 中 。K- 核 分 解 过 程 是 层 层 分析 
网 络 结构 ， 从 外 向 内 层 延 伸 式 扩展 进行 。 它 通过 递归 
的 方法 逐渐 移 去 网 络 中 所 有 度 值 小 于 或 等 于 K 的 用 
户 , 通过 K- 核 的 分 解 ， 能够 描述 网 络 的 结构 特性 ， 揭 
示 网 络 层次 性 质 。 那 么 , 最 小 K- 核 用 户 为 网 络 最 外 层 
的 用 户 , 图 2 是 用 户 关系 网 络 的 K- 核 分 解 示意 图 。 
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图 2 KK- 核 分 解 示 意图 


图 2 中 , n 位 用 户 可 以 进行 4 种 分 区 ， 其 度数 分 别 
为 2、3、5、6, 其 中 6- 核 是 最 大 的 连通 子 图 , 包括 的 
用 户 也 处 于 核心 -边缘 图 的 核心 区 ,其 中 的 每 个 用 户 
至 少 与 图 中 的 其 他 6 个 用 户 相 连 。 从 最 大 的 6- 核 到 5- 
核 、3- 核 , 最 后 是 最 小 的 2- 核 , 大 核 都 是 小 核 的 子 图 ， 
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在 小 核 中 可 以 完全 找到 大 核 中 包含 的 用 户 。 从 小 核 到 
大 核 聚 类 的 过 程 中 , 每 级 可 能 会 产生 剩余 用 户 。 
3.3 “分析 K- 核 塌 缩 序列 

K- 核 是 在 整个 图 中 的 一 个 凝聚力 相对 较 高 的 区 
域 , 但 它 不 一 定 是 最 大 的 凝聚 子 图 ， 因为 有 可 能 存在 
一 些 相 互 之 间 联 系 松散 , 但 却 有 很 高 凝聚 力 的 区 域 ， 
即 网 络 存在 总 体 分 裂 性 .Seidman05 用 核 塌 缩 序列 来 估 
计 一 个 网 络 的 总 体 分 裂 性 , 核 塌 缩 序 列 主 要 针对 的 是 
网 络 中 每 次 升级 聚 类 产生 的 剩余 用 户 , 一 个 K- 核 中 的 
点 可 以 分 为 两 个 集合 : 在 K+1 中 的 点 和 不 在 该 核 中 的 
点 。Seidman0 将 后 一 群体 称 为 K- 剩 余 集合 , 每 当 K 
增加 一 个 单位 ,从 核 中 消失 的 点 所 占 的 比例 可 以 排列 
为 一 个 向 量 ( 即 一 行 简单 的 数值 )， 可 用 该 向 量 描述 成 
分 内 部 的 局 部 密度 结构 ,如果 向 量 中 的 值 持续 增加 到 
比较 高 的 K 值 , 说 明 网 络 的 结构 具有 一 致 性 ， 如 果 向 
量 中 的 K 值 在 较 低 的 值 出 现 以 后 持续 出 现 了 0 值 , 说 
明 网 络 中 存在 多 个 高 密度 区 。 

表 1 为 K- 核 的 塌 缩 示意 图 随 着 K- 核 的 逐渐 塌 
缩 , K 值 在 从 0 到 6 增加 的 过 程 中 产生 了 许多 剩余 用 
户 , 得 到 的 核 塌 缩 序列 为 : (0.05, 0.10, 0.15, 0.00, 0.10， 
0.15, 0.45), 具体 的 序列 变化 如 图 3 所 示 。 

表 1 KK- 核 塌 缩 示意 图 


剩余 点 
K 值 剩余 用 户 颜色 
所 占 比 例 
0 US 0.05 粉色 [到 | 
1 Ull U3 0.10 黑色 mm 
2 U2 Ul4、 Un-2、 Un 0.15 蓝 色 ml 
3 0 0.00 
4 U4 U15 0.10 灰色 国 
5 Ul Un-l 0.15 红色 口 
U1l2、 U13、U9、U10、U6 
6 ~ ~ ~ ~ h 0.45 Ny 语 伟 色 本 
U7、 U8、 U16、 U17 浅 绿 
0.50 
0.45 9 
0.40 
0.35 + 
地 0.30 + 
及 (3s # 
0.20 0.15 O05 
0.15 4 1 
0.10—6:05 一 = 一 re 一 
0.05 一 一 一 0.00-- 一 
000 0 I 2 3 4 5 6 


图 3 区 - 核 塌 缩 序 列 示 意图 
在 图 3 中 , 当 K 处 于 [0, 2] 时 , 向 量 值 由 0.05 到 
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0.15; 然后 ， 当 K 为 3 时 , 向 量 值 为 0, 塌 缩 序列 有 小 
幅 变 动 , 向 量 值 整体 上 逐渐 增 大 ,所 以 K 分 别 为 4 和 5 
时 会 产生 高 密 子 群 ， 即 分 别 以 用 户 (U4、U15、U1、 
Un-1) 为 中 心 ， 即 子 群 (U4、U15、U6、U13)、(U1l、 U10、 
U12、U13、U17、Un-1), 它们 是 除了 常见 的 6- 核 子 群 
(U12、 U13、U9、 U10、U6、U7、U8、U16、U17) 之 
外 发 现 的 小 众 社区 。 

对 于 第 1 个 子 群 ， 可 以 将 U4、U15 的 资源 偏好 推 
荐 给 小 众 社区 中 其 他 用 户 ; 同 理 , 对 于 第 2 个 子 群 , 可 
以 将 UL 、Un-l 的 资源 偏好 进行 推荐 。 


4 实验 及 结果 分 析 


4.1 数据 采集 
通过 豆 久 的“ 读书” 页面 对 用 户 数据 进行 随机 抓 
取 ， 从 每 个 用 户 关注 的 其 他 用 户 中 随机 选取 样本 ， 同 
时 采用 滚雪球 的 方式 展开 , 共 取 得 35 位 用 户 的 资料 ， 
为 方便 统计 , 每 个 用 户 均 赋予 编号 , 同时 每 个 用 户 的 
标签 是 去 掉 重 复 标注 次 数 后 得 到 的 数量 ,35 位 用 户 的 
最 终 标签 数 是 1 208。 

对 35 位 用 户 的 所 有 标签 进行 频次 降序 排序 , 截取 
其 中 排名 前 100 位 的 标签 ,数据 如 表 2 所 示 ， 其中“ 文 
学 ”的 频次 最 高 ,说 明 35 位 用 户 中 喜好 文学 的 较 多 。 

表 2 豆 泊 数据 标签 频次 排序 (部 分 ) 


序号 ”标签 频次 序号 标签 频次 序号 ”标签 ”频次 
1 文学 21 14 女性 6 27 香港 4 
2 散文 12 15 社会 6 28 文化 4 
3 历史 。 11 16 生活 5 29 ”张爱玲 3 
4 日 本 10 17 随笔 5 30 爱情 3 
5 传记 8 18 设计 5 31 科普 3 
6 短篇 集 8 19 美国 5 32 故事 3 
7 漫画 8 20 管理 5 33 音乐 3 
8 外 国 8 21 英国 5 34 梦想 2 
9 小 说 6 22 摄影 5 35 ”安妮 宝贝 2 
10 绘本 6 23 旅行 5 36 ”张大 春 2 
ll1 台湾 6 24 童话 4 37 思想 史 2 
12 B 影 6 25 上海 4 38 动物 2 
13 艺术 6 26 经 济 4 39 时 尚 2 


将 35 位 用 户 按 相应 的 编号 形成 标签 共 现 矩阵 ， 首 
先 按 使 用 频次 对 标签 集合 排序 , 将 排名 前 37 位 的 标签 
截取 成 为 样本 数据 ; 然后 分 析 35 位 用 户 使 用 这 37 个 
标签 的 具体 情况 , 按 两 位 用 户 同时 使 用 过 的 标签 次 数 


计算 , 如 果 有 3 次 , 则 两 位 用 户 的 标签 共 现 值 就 为 3， 
和 矩阵 中 对 角 线 均 设 为 某 一 值 ， 如 0, 表示 用 户 与 自身 
之 间 的 关系 ; 最 后 形成 标签 共 现 矩阵 。 
4.2 ”结果 分 析 

在 Ucinet 中 对 豆瓣 数据 进行 K- 核 分 析 的 结果 如 
图 4 所 示 : 


图 4 豆 闪 数据 的 区- 核 分 析 


图 4 中 ,35 位 用 户 可 以 进行 7 种 分 区 ,其 度数 分 别 
为 3、4、5、7、8、9、10。10- 核 是 最 大 的 连通 子 图 , 包 
括 的 用 户 也 处 于 核心 -边缘 图 的 核心 区 ， 其 中 的 每 个 
用 户 至 少 与 图 中 的 其 他 10 个 用 户 相 连 。 从 最 大 的 10- 
核 到 9- 核 、8- 核 、7- 核 、5- 核 、4- 核 ,最 后 是 最 小 的 3- 
核 , 大 核 都 是 小 核 的 子 图 , 在 小 核 中 可 以 完全 找到 大 
核 中 包含 的 用 户 。 

从 小 核 到 大 核 聚 类 的 过 程 中 ,每 级 可 能 会 产生 剩 
余 用 户 , 表 3 为 豆 兴 数据 中 K- 核 的 塌 缩 。 从 0 到 10 
增加 的 过 程 中 产生 了 许多 剩余 用 户 , 得 到 的 核 塌 缩 序 
列 为 : (0.06, 0.09, 0.00, 0.11, 0.11, 0.14, 0.00, 0.03, 0.03， 
0.03, 0.40), 序列 的 变化 如 图 5 所 示 。 
表 3 豆瓣 数据 中 K- 核 的 塌 缩 


K 值 剩余 用 户 所 占 比 例 
0 U29、U32 0.06 
1 Ull U21、 U23 0.09 
2 0 0.00 
3 U3 U5 U18、 U31 0.11 
4 U2、 U20、U24、U27 0.11 
5 U4 U14、 U15、 U33、U35 0.14 
6 0 0.00 
7 U25 0.03 
8 U30 0.03 
9 Ul 0.03 
10 U6, U7 U8, U9 U10、 U12, U13、 Do 

U16、 U17、 U19、U22、U26、U28、U34 


|。 
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图 5 豆 闪 数据 区- 核 塌 缩 序列 


图 5 中 ,， 当 处 于 [0, 5] 区 间 时 , 向 量 值 先 从 0.06 
下 降 到 0, 然后 又 上 升 到 0.14, 虽然 塌 缩 序列 有 小 幅 变 
动 , 但 向 量 值 整体 上 是 逐渐 增 大 的 ， 旦 增加 的 幅度 比 
较 小 , 所 以 此 区 间 的 塌 缩 序列 变动 可 以 不 予 考虑 ; 但 
是 当 在 K 处 于 [5, 10] 区 间 时 , 向 量 值 首先 从 0.14 降 到 
0, 然后 又 增加 到 0.03, 塌 缩 序列 发 生 了 一 些 变 动 , 最 
后 当 开 为 10 时, 向 量 值 突然 增加 到 0.40, 塌 缩 序列 发 
生 了 非常 大 的 变动 ,所 以 当 K 分 别 为 7, 8, 9 的 时 候 , 网 
络 会 产生 三 个 高 密 子 群 ， 前 两 个 高 密 子 群 均 是 小 众 社 
区 , 第 一 个 小 众 社区 (U30、U1l、U26、U27、U2、U10) 
以 U30 和 U1 为 核心 , 第 二 个 小 众 社区 (U25、U26、 
U34、U12、U16) 以 U25 为 核心 , 第 三 个 高 密 子 群 (U6、 
U7、 U8、 U9 U10、 U12、 U13、 U16、 U17、 U19、 
U22、U26、U28) 以 U26 和 U28 为 核心 核心 用 户 可 
以 将 其 所 掌握 的 资源 向 其 所 在 的 小 众 社区 用 户 推荐 。 

(1) 与 度数 中 心 度 比 较 

在 社会 网 络 分 析 中 ,如果 一 个 用 户 的 中 心 度 越 高 ， 
就 说 明 该 用 户 处 于 网 络 的 核心 区 ,部 分 拥有 较 高 度数 
中 心 度 的 用 户 ,， 如 表 4 所 示 : 
表 4 豆 泊 数据 的 度数 中 心 度 


二 是 度数 中 心 度 启 度数 中 心 度 
U26 82.353 U6 47.059 
U28 58.824 U16 41.176 
U10 58.824 U12 41.176 
U13 58.824 Ul 35.294 
U9 55.882 U19 35.294 
U22 52.941 US 32.353 
U17 50.000 U30 31.238 


表 4 中 ,U26 的 度数 中 心 度 最 高 , 说 明 该 用 户 是 网 
络 中 的 核心 用 户 , 依次 是 U28、U10、U13 等 ,此 表 中 
并 没有 发 现 Ul1、U30 的 核心 地 位 ; 但 是 从 K- 核 塌 缩 序 
列 的 角度 , 却 发 现 Ul1、U25 及 U30 均 为 小 众 社区 的 核 


XIANDAI TUSHU QINGBAO JISHU 


201711.02041v1 


chinaXiv 


心 用 户 。 
(2) 与 最 小 天- 核 值 深度 比较 
在 社会 网 络 分 析 中 , 存在 大 量 的 K- 核 值 很 小 的 用 
户 , 一 般 为 边缘 用 户 ， 从 该 类 节点 的 邻居 集中 的 最 大 
K- 核 值 即 深度 ,可 以 发 现 核心 用 户 , 表 5 是 豆 兴 数据 
的 最 小 KK- 核 值 (一 般 为 0 或 1) 的 深度 。 
表 5 豆 斩 数据 的 最 小 KK- 核 值 的 深度 


用 户 K- 核 值 深度 
U29 0 0 
U32 0 0 
Ull 1 3 
U21 1 28 
U23 1 4 


表 5 中 , 由 于 U21 的 深度 为 28， 即 该 节点 的 邻居 
集中 的 最 大 K- 核 值 为 28, 结合 图 4, 可 以 发 现 邻 居 
U26 为 核心 用 户 , 但 没有 发 现 U1、U25、U28、U30 
的 核心 地 位 。 

因此 ,利用 社会 网 络 分 析 方 法 在 发 现 核 心 用 户 方 
面 , 与 基于 度数 和 最 小 KK- 核 值 深 度 方法 相 比 ， 基 于 K- 
核 塌 缩 序列 的 方法 具有 一 定 的 优势 。 


S 结 语 


本 文 在 KK- 核 的 基础 上 提出 利用 KK- 核 塌 缩 序列 发 
现 社会 网 络 群体 中 的 核心 用 户 , 对 其 所 在 的 小 众 社区 
进行 小 众 推荐 , 并 利用 豆 办 网 中 的 读书 社交 平台 提取 
样本 数据 进行 实 证 分 析 , 结果 证 明基 于 K- 核 塌 缩 序 
列 方法 发 现 核心 用 户 与 度数 、 介 数 、 最 小 KK- 核 深度 值 
等 方法 相 比 较 具有 可 行 性 及 优越 性 。 但 是 , 本 文 也 存 
在 一 定 的 局 限 性 ,一 方面 仅 考 察 了 豆 办 读书 用 户 , 样 
本 数据 相对 较 小 ; 另 一 方面 由 于 在 K- 核 值 相同 的 情况 
下 , 无 法 对 核心 用 户 所 在 小 众 社区 中 其 他 用 户 进 行 排 
序 。 因 此 后 期 工作 将 不 断 扩大 样本 研究 数据 ， 进 一 步 
完善 和 改进 K- 核 塌 缩 序列 排序 算法 , 为 用 户 提 供 更 好 
的 社会 化 小 众 信 息 资源 。 
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Identifying Core Users in Social Resource Recommendation System 
with K-shell Collapse Sequences 
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Abstract: [Objective] This study aims to identify the core users in social minority groups with the help of social 
network behavior analysis technique, and then improve the service of social resources recommendation. [Methods] 
First, we collected 1,208 user tags from the website of Douban Reading, and built co-occurrence matrix for the top 100 
tags. Second, we analyzed these users’ K-shell network structure and then investigated its collapse sequences volatility. 
[Results] We found new core users from the social minority group using the proposed method. [Limitations] The 
sample data size was relatively small and from only one specific field. The K-shell analysis method needed to be 
modified to improve the result ranking. [Conclusions] The proposed method could help the social media administrators 
develop new resources recommendation strategy, and promote the development of social networking systems. 


Keywords: Core user Socialresource recommendation Social network analysis K-shell collapse sequences 


Innovative 推出 Knowledge Base 1.0 版 ， 助 力图 书馆 电子 内 容 生 命 周期 管理 


全 球 领先 的 图 书馆 自动 化 软件 提供 商 Innovative Interfaces 于 近日 推出 Knowledge Base 1.0 版 ， 助 力图 书馆 内 容 生命 周期 
的 综合 管理 和 馆藏 内 容 的 精确 视图 。 

Knowledge Base 是 基于 Web 的 应 用 程序 , 拥有 一 个 直观 的 、 现 代 化 的 用 户 界面 ， 以 及 高 度 优 化 的 索引 ,使 得 其 图 书馆 用 
户 受 益 于 更 高 效 的 工作 流 和 简化 的 内 容 生 命 周 期 管理 。Knowledge Base 1.0 版 增强 了 馆藏 管理 的 用 户 体 验 ,， 提供 电子 订阅 内 
容 的 实时 发 现 和 访问 。 通 过 整合 整个 图 书馆 系统 的 馆藏 资源 和 内 容 资源 ,图 书馆 员工 能 够 快速 识别 所 有 资源 的 覆盖 情况 。 
Knowledge Base 的 独特 之 处 在 于 其 识别 所 有 内 容 的 能 力 , 不论 是 来 自 哪 家 内 容 供应 商 的 内 容 , 都 能 通过 预测 搜索 功能 在 一 个 
集中 的 地 方 进行 识别 。 现 在 ,工作 人 员 将 能 够 通过 输入 关键 词 检 索 范 围 更 广 的 数据 库 , 查看 图 书馆 已 经 订阅 的 或 是 没有 订阅 
的 条 目 。Knowledge Base 为 图 书馆 提供 : 

(1) 电子 资源 管理 (Electronic Resource Management ERM): 更 加 有 效 的 馆藏 馆 理 ; 

(2) OpenURL 链接 解析 器 : 全 文 实时 访问 ; 

(3) 发 现 功能 : 确保 读者 能 够 方便 快捷 地 找到 他 们 所 需要 的 资源 。 

考虑 到 出 版 商 添加 或 删除 内 容 的 频率 , Knowledge Base 在 更 精确 的 条 目 覆 盖 度 更 新 上 投入 了 许多 精力 。Innovative 已 显 
著 减 少 图 书馆 员工 意识 到 条 目 名称 修 改 的 时 间 延 迟 , 将 行业 标准 时 间 延 迟 从 一 个 月 缩短 到 两 周 。 与 Innovative 所 提供 的 其 他 
产品 一 样 , Knowledge Base 是 建立 在 一 个 安全 的 、 大 规模 的 、 可 扩展 的 云 平 台 基 础 上 , 这 正 是 Innovative 致力 于 整合 多 源 信 
息 的 使 命 的 写照 。Knowledge Base 1.0 版 现 可 供 所 有 部 署 了 Sierra 解决 方案 的 图 书馆 使 用 。 


(编译 自 : https://www.iii.com/news-events/pr/innovative-launches-knowledge-base-release-10-electronic-content-lifecycle- 


management) 
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